home *** CD-ROM | disk | FTP | other *** search
/ Columbia Kermit / kermit.zip / newsgroups / misc.19990725-20000114 / 000225_news@columbia.edu _Sat Oct 23 14:57:27 1999.msg < prev    next >
Internet Message Format  |  2020-01-01  |  3KB

  1. Return-Path: <news@columbia.edu>
  2. Received: from newsmaster.cc.columbia.edu (newsmaster.cc.columbia.edu [128.59.59.30])
  3.     by watsun.cc.columbia.edu (8.8.5/8.8.5) with ESMTP id OAA16301
  4.     for <kermit.misc@watsun.cc.columbia.edu>; Sat, 23 Oct 1999 14:57:26 -0400 (EDT)
  5. Received: (from news@localhost)
  6.     by newsmaster.cc.columbia.edu (8.8.5/8.8.5) id OAA19194
  7.     for kermit.misc@watsun.cc.columbia.edu; Sat, 23 Oct 1999 14:36:01 -0400 (EDT)
  8. X-Authentication-Warning: newsmaster.cc.columbia.edu: news set sender to <news> using -f
  9. From: fdc@watsun.cc.columbia.edu (Frank da Cruz)
  10. Subject: Re: KOI80-u (was DEC-C version 6 question)
  11. Date: 23 Oct 1999 18:36:00 GMT
  12. Organization: Columbia University
  13. Message-ID: <7usv6g$inb$1@newsmaster.cc.columbia.edu>
  14. To: kermit.misc@columbia.edu
  15.  
  16. In article <Pine.BSF.4.05.9910231910520.15947-100000@ff.dsu.dp.ua>,
  17. Dmitry Pryanishnikov  <dmitry@digital.dp.ua> wrote:
  18. : On Sat, 23 Oct 1999, Frank da Cruz wrote:
  19. : > :  255       FF      U042A      CYRILLIC CAPITAL LETTER HARD SIGN
  20. : > : 
  21. : > This is the first time I heard of KOI8-u.  How does it differ from 
  22. : > KOI8-r?  Can you tell me where I can find a code chart for KOI8-u?
  23. :  Is suspect the full RFC is too large to post it here... So I put here
  24. : just heading:
  25. Thanks.  This is somewhat off-topic for the VMS newsgroup (sorry) but...
  26.  
  27. KOI8 is a becoming a very confusing term!  The first KOI8 was GOST (USSR
  28. Standard) 19768-1974.  It was published outside the USSR as ECMA-113
  29. Edition 1.  In this version, the Cyrillic letters line up with the Roman
  30. ones "by sound" (there is also a 7-bit version called Short KOI or KOI7,
  31. in which Roman and Cyrillic exist side by side but only in uppercase, also
  32. aligned by sound).
  33.  
  34. The original KOI8 was superseded by GOST 19768-1987 and published as
  35. ECMA-113 Second Edition and as ISO 8859-5, the ISO Latin/Cyrillic Alphabet
  36. (which, by the way, has the Ukranian and Belorussion characters).  This one
  37. is sometimes also called "New KOI8" and the previous one is called "Old
  38. KOI8".
  39.  
  40. Now I realize that Old KOI8 is used widely in netnews and email instead of
  41. ISO 8859-5, and I understand why: if you don't have a Cyrillic font or code
  42. page, you can strip off the 8th bit and still read Old KOI8 text in Roman
  43. letters "by sound".  The part I did not realize before was that line- and
  44. box-drawing characters had been added to Old KOI8 in columns 8 through B.
  45. When did that happen?  Where is it documented?  (And how could graphic
  46. characters be defined for columns 8 and 9, which are reserved for C1
  47. control characters? -- This makes it incompatible with ISO 2022).  And what
  48. do we call this Old KOI8 with box drawing?  "New Old KOI8?"
  49.  
  50. My other question is: RFC2319.TXT states that the four Ukrainian letters
  51. (8 code points) are added at A4, A6, A7, AD, B4, B6, B7, and BD.  What
  52. characters in "New-Old KOI8" were replaced, if any?
  53.  
  54. If I discover the answers to these questions, maybe I can add support for
  55. KOI8-u and "New Old KOI8-r" to C-Kermit 7.0.  ("Old Old KOI8[-r]" is
  56. already supported, as are ISO 8859-5, CP855, CP866, CP1251, Short KOI, and
  57. now also the UCS).
  58.  
  59. - Frank